課程資訊
課程名稱
流行病學與生物統計計算
Computing in Epidemiology and Biostatistics 
開課學期
108-1 
授課對象
共同教育中心  統計碩士學位學程  
授課教師
林菀俞 
課號
EPM5002 
課程識別碼
849 U0310 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一6,7(13:20~15:10) 
上課地點
公衛214 
備註
生醫資訊與生物統計學領域選修課程之一。與李文宗合授
限學士班三年級以上
總人數上限:60人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1081EPM5002_Comp 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程為U字頭,歡迎大學部或碩博士班同學選修。在多數的流行病學或生物統計的課程中,同學學習到的常是理論模式,接著使用軟體套件來分析資料、取得結果。然而,在這兩個學習部分的中間卻存在著一個黑盒子。為能連接理論與軟體分析報表,本課程將介紹在理論模式背後所需進行的數學計算過程,讓同學能夠清楚地瞭解統計軟體如何執行及運算出模式結果,從中學習矩陣運算、數值分析、蒙地卡羅模擬等數學工具的妙用。本課程並訓練學生能自行撰寫程式,解決流行病學與生物統計學實務問題。
本課程將使用統計計算上常用的軟體R與SAS,以處理流行病學與生物統計範疇的問題為主要目的,諸如:如何從統計分布來建構概似函數、進而求得最大概似估計值?如何求得線性回歸裡的回歸係數估計值?羅吉斯回歸裡的回歸係數估計值與精確信賴區間(exact confidence interval)是如何求得?本課程將深入淺出地傳達統計與數值運算的理念,且讓同學在實際操作中體會統計與程式計算的趣味。

In most epidemiology and Biostatistic courses, we usually introduce the theoretical models, and then use some software (such as SAS and R) to analyze the data. However, there is a black box between these two parts. To fill in the gap, we will teach the numerical computation process behind statistical models. Students will learn matrix operations, numerical analyses, Monte-Carlo simulations, etc. We will teach how to construct a log-likelihood function based on a statistical distribution, how to obtain maximum likelihood estimates, how to build exact confidence intervals, by functions written by students themselves (rather than using some built-in function in R or SAS).
 

課程目標
本課程為U字頭,歡迎大學部或碩博士班同學選修。啟發大學部或碩博士班同學對流行病學與生物統計相關問題之數值計算的興趣,培養同學對數值運算與編寫程式之思維與邏輯,俾便將來於生物統計、流行病學方法論或數量相關的研究更能得心應手,且對數量流行病學與生物統計學能有更深一層的體悟。

Students will learn matrix operations, numerical analyses, Monte-Carlo simulations, etc. We will teach how to construct a log-likelihood function based on a statistical distribution, how to obtain maximum likelihood estimates, how to build exact confidence intervals, by functions written by students themselves (rather than using some built-in function in R or SAS).
 
課程要求
本課程為U字頭,歡迎大學部或碩博士班同學選修。同學需先修過(生物)統計學或流行病學等相關基礎課程。

Prerequisite course: at least one biostatistics (or statistics) or epidemiology course.
 
預期每週課後學習時數
 
Office Hours
另約時間 備註: By appointment 
指定閱讀
課程講義 (Teachers' handouts.) 
參考書目
1. Owen Jones, Robert Maillardet, and Andrew Robinson (2009). “Introduction to scientific programming and simulation using R”. Chapman & Hall/CRC.
2. Marcello Pagano and Kimberlee Gauvreau (2000). “Principles of Biostatistics”. 2nd edition. Duxbury Press.
 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
課堂參與及表現 
40% 
Class participation and discussions 
2. 
作業 
60% 
Assignments and homework 
 
課程進度
週次
日期
單元主題
第1週
9/9  R 的安裝與起始 (林菀俞老師)
Install and start R 
第2週
9/16  函數運算 (林菀俞老師)
Programming with functions 
第3週
9/23  ASPPH系列國際研討會教育週 
第4週
9/30  颱風停課 
第5週
10/7  物件型態、程式邏輯與迴圈運算、R的輸入輸出與繪圖 (林菀俞老師)
(called off because of typhoon) R objects, programming logics, R looping, input and output 
第6週
10/14  認識矩陣 (李文宗老師)
Introduction to matrix algebra 
第7週
10/21  矩陣運算 (李文宗老師)
Matrix operations and linear algebra 
第8週
10/28  矩陣代數的妙用 (李文宗老師)
Matrix algebra in statistics 
第9週
11/4  期中考週 (no class) 
第10週
11/11  apply 家族函數與遞迴程式、矩陣運算指令 (林菀俞老師)
The clever “apply” family, recursive programming, matrix operations 
第11週
11/18  求函數解與確切信賴區間 (林菀俞老師)
Find the root of a function; exact confidence intervals 
第12週
11/25  建構概似函數 (林菀俞老師)
Construct a log-likelihood function 
第13週
12/2  求解最大概似估計值 (I) (林菀俞老師)
Find the maximum likelihood estimates for a logistic regression 
第14週
12/9  求解最大概似估計值 (II) (林菀俞老師)
Find the maximum likelihood estimates for a Poisson regression 
第15週
12/16  現代統計計算:蒙地卡羅模擬 (I) (林菀俞老師)
Modern statistical computing in R: Monte-Carlo simulations (Interval estimates) 
第16週
12/23  現代統計計算:蒙地卡羅模擬 (II) (林菀俞老師)
Modern statistical computing in R: Monte-Carlo simulations (Point estimates) 
第17週
12/30  現代統計計算:蒙地卡羅模擬 (III) (林菀俞老師)
Modern statistical computing in R: Monte-Carlo simulations (Type I error rates and power) 
第18週
2020/1/6  期末考週